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Beschreibung 

Verfahren zum Ubermitteln von Sprachdaten 

5 Die vorliegende Erfindung betrifft ein Verfahren zum Ubermit- 
teln von Sprachdaten, wobei die Sprachdaten vor dem Obermit- 
teln komprimiert und am Obertragungsziel wieder dekomprimiert 
werden. Das Komprimieren beruht dabei auf einem Zerlegen der 
Sprachdaten in Phoneme. Phoneme sind die fur die Wahrnehmung 
10 gesprochener Sprache wesent lichen akustischen Sprachelemente. 

Es ist bekannt, Sprachdaten vor einem Obermitteln in einem 
Kommunikationsnetz zu komprimieren, urn mSglichst wenig tJber- 
tragungsbandbreite im Kommunikationsnetz zu belegen. Bei ei- 

15 ner Wiedergabe der Sprache am Ubermittlungsziel werden in 
diesen Fallen die komprimierten Sprachdaten durch Dekompri- 
mieren wieder in den Ursprungszustand oder einen dazu gleich- 
wertigen Zustand zuruckgeftihrt . Da sich die durch ein solches 
Verfahren erzielbare Reduktion der Obertragungsbandbreite di- 

20 rekt nach der Kompressionsrate des verwendeten Komprimie- 

rungsverfahrens richtet, ist eine moglichst hohe Kompressi- 
onsrate erstrebenswert . 

Bei Sprachubermittlung werden ublicherweise Pradiktionsver- 
25 fahren zum Komprimieren eingesetzt, welche die statistische 
Ungleichverteilung der in Sprachdaten auf tretenden Datenmu- 
ster ausnutzen, um eine Sprachdaten eigentumliche, hohe Red- 
undanz zu reduzieren. Beim Dekomprimieren konnen die ur- 
sprunglichen Sprachdaten aus den komprimierten Sprachdaten 
30 bis auf geringe, verfahrensinharente Verluste, nahezu verfal- 
schungsfrei rekonstruiert werden. Die erreichbare Kompressi- 
onsrate liegt dabei in der GrOBenordnung von etwa 1:10. Ver- 
fahren dieser Art sind beispielsweise in information und Co- 
dierung" von Richard W. Hamming, VCH Verlagsgesellschaft 
35 Weinheim, 1987, Seiten 81 bis 97 beschrieben. 
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In typischen Sprachdaten macht eine rein inhaltliche Informa- 
tion nur einen geringen Bruchteil der gesamten Sprachinforma- 
tion aus. Der grGflte Teil der Sprachinformation besteht in 
der Regel aus sprecherspezif ischer Information, die sich z.B. 
5 in Nuancen der Stimme oder der Stimmlage des Sprechers aus- 
driickt. Kommt es bei einer Ubermittlung von Sprachdaten im 
wesentlichen nur auf deren inhaltliche Information an, z.B. 
bei rein informativen Mitteilungen, automatischen Ansagen 
o.a., sind daher durch Reduktion der sprecherspezif ischen In- 
10 formation auch wesentlich hohere Kompressionsraten maglich 

als mit Verfahren, die den Inf ormationsgehalt der Sprachdaten 
vollstandig oder nahezu vollstandig erhalten. 

Die kleinsten akustischen Einheiteh, in denen Sprache vom 
15 Sprecher formuliert wird und in denen sich auch die inhaltli- 
che Information - die gesprochenen Worter - ausdrUckt, sind 
Phoneme. Aus den Patentschrif ten EP 71716 Bl, DE 3513243 G2 
und EP 423800 Bl sind bereits Anordnungen und Verfahren be- 
kannt, bei denen ein Sprachdatenstrom hinsichtlich der darin 
20 enthaltehen Phoneme analysiert und in einen Strom von den er- 
kannten Phonemen jeweils zugeordneten Kodezeichen umgesetzt 
wird, vm die Sprachdaten dadurch vor einem Ubermitteln zu 
komprimieren . 

25 Ein wesentliches Problem besteht dabei darin, die Phoneme, 
aus welchen sich ein beliebiger zu tibermittelnder Sprachda- 
tenstrom zusammensetzt, zuveriassig zu erkennen. Dies wird 
insbesondere dadurch erschwert, dafi dasselbe Phonem je nach 
Sprecher und dessen Sprachgewohnheit in sehr unterschiedli- 

30 cher Auspragung auftreteh kann. Werden Phoneme innerhalb des 
Sprachdatenstroms nicht erkannt oder falschen Lauten zugeord- 
net, verschlechtert sich die Obertragungsqualitat der Sprache 
- unter Umstanden bis zur UnverstSndlichkeit . Eine verlaBli- 
che Phonemanalyse ist daher ein wichtiges Kriterixam filr die 

35 Qualit&t bzw. die Anwendungsbreite derartiger Sprachtlbermitt- 
lungsver f ahren . 
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Aufgabe der vorliegenden Erfindung ist es, ein flexibles und 
ef fizientes Verfahren zum Obermitteln von Sprachdaten anzuge- 
ben, bei dem Sprachdaten durch eine verbesserte Phonemanalyse 
vor dem Obermitteln komprimiert werden konnen. 

5 

Gelost wird diese Aufgabe erf indungsgemaB durch ein Verfahren 
mit den Merkmalen des Patentanspruchs 1 . 

Vorteilhafte Weiterbildungen der Erfindung sind in den Un- 
10 teranspriichen angegeben. 

Bel einem erf indungsgemaB en Verfahren werden von einer 
Sprachdat enquelle zu einem Ubermittlungsziel zu tibermittelnde 
Sprachdaten vor dem eigentlichen Ubertragen einer Phonemana- 

15 lyse unterzogen. Zur Anwendung des Verfahrens k5nnen die 

Sprachdaten in vielerlei Form vorliegen; beispielsweise in 
analoger oder digitalisierter Form oder als Sprachsignale be- 
schreibende Merkmalsvektoren, jeweils in zeit- und/oder fre- 
quenzaufgeloster Darstellung. Die Phonemanalyse wird erf in- 

20 dungsgemSB durch ein neuronales Netz ausgefiihrt, das auf ein 
Erkennen von Phonemen trainiert ist. Die Prinzipien einer 
Sprach- bzw. Phoneme rkennung mitt els neuronaler Netze sind 
beispielsweise in „Review of Neutral Networks for Speech Re- 
cognition^ von R. P. Lippmann in Neural Computation 1, 1989, 

25 Seiten 1 bis 38 beschrieben. 

Die Phoneme nach deiien der Sprachdatenstrom zu analysieren 
ist und auf die das neuronale Netz trainiert ist, sind in 
sprach- und/oder sprecherspezif ischen Phonemkatalogen hinter- 

30 legt f wo ihnen jeweils ein eindeutiges Kodezeichen, z.B. ein 
Index oder eine Nummer, zugeordnet ist. Als Sprache kOnnen in 
diesem Zusammenhang u.a. Landessprachen, regionale Dialekte 
und AusprSgungen von Sprachbesonderheiten verstanden werden. 
Die sprach- bzw. sprecherspezif ischen Phonemkataloge konnen 

35 in einem das. erf indungsgemSBe Verfahren vorbereitenden 

Schritt durch Analyse von jeweils unterschiedlichen Sprachen 
angehorenden und/oder von unterschiedlichen Sprechern stam- 
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menden, reprasentativen Sprachdaten erstellt werden. Dabei 
werden diejenigen akustischen Sprachelemente, die sich fur 
die jeweiligen reprasentativen Sprachdaten als charakteri- 
stisch erweisen oder eine representative Idealform dieser 
5 Sprachelemente/ als Phoneme im betreffehden Phonemkatalog 

hinterlegt-. Die Analyse der reprasentativen Sprachdaten kann 
insbesondere auch mit Hilfe eines neuronalen Netzes durchge- 
ftlhrt werden. Ferner kann die Auswahl von reprasentativen 
Sprachdaten bzw. deren charakteristischen Sprachelementen 
10 vorteilhaf terweise Besonderheiten der zu libermittelnden 

Sprachdaten, wie z.B. Hintergrundgerauschen o.a., angepafit 
werden. 

Ein Phonemkatalog kann beispielsweise als ein konventioneller 
15 Speicher und/oder als Teil eines trainierten neuronalen Net- 
zes realisiert sein, wobei im letzten Fall die hinterlegten 
Phoneme durch einen inneren Zustand des trainierten neurona- 
len Netzes reprasentiert sein konnen. Weiterhin kann die den 
Lernzustand des neuronalen Netzes bestimmende, sogenannte Ge- 
20 wichtsmatrix als Phonemkatalog aufgefafit werden. Eine solche 
Gewichtsmatrix kann aus einem trainierten neuronalen Netz 
ausgelesen, in einem Speicher hinterlegt und bei Bedarf in 
ein beliebiges neuronales Netz eingelesen werden, das dadurch 
zu einem entsprechend trainierten neuronalen Netz wird. 

25 

Vof der Phonemanalyse der Sprachdaten durch ein neuronales 
Netz wird zunachst einer der sprach- und/oder sprecherspezi- 
fischen Phomenkataloge ausgewahlt und die Sprachdaten an- 
schliefiend dem auf das Erkennen der in dem ausgewahlteh Pho- 

30 nemkatalog hinterlegten Phoneme trainierten neuronalen Netz 
zur Phonemanalyse zugeftlhrt. Die Auswahl des Phonemkatalogs 
kann dabei abhSngig von einer Kennung eines die zu tlbertra- 
genden Sprachdaten sendenden Teilnehmers erfolgen oder von 
einem sprach- und/oder sprecherunterscheidenden neuronalen 

35 Netz veranlaflt werden, das auf ein Erkennen der Sprache, der 
die zu tibertragenden Sprachdaten angehOren, und/oder des 
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Sprechers, von dem die zu Obertragenden Sprachdaten stammen, 
. trainiert ist. 

FUr die bei der Phonemanalyse in den Sprachdaten erkannten 
5 Phoneme wird das diesen im ausgewahlten Phonemkatalog jeweils 
zugeordnete Kodezeichen ermittelt und anstelle des dem jewei- 
ligen Phonem entsprechenden Sprachdatenmusters zum Ubermitt- 
lungsziel Ubertragen. Da die Ubertragenen Kodezeichen im all- 
gemeinen wesentlich kttrzer als die dadurch reprasentierten 

10 Sprachdatenmuster sind, wird die zu tibertragende Datenmenge 

im allgemeinen wesentlich reduziert und so eine hohe Kompres- 
sionsrate erzielt. Am Ubermittlungsziel werden die empfange- 
nen Kodezeichen einer Sprachsyntheseeinrichtung zugeftihrt, 
die den Strom der Kodezeichen wieder in eine Abfolge von Pho- 

15 nemen umsetzt und ausgibt. Zum Ersetzen der empfangenen Kode- 
zeichen durch auszugebende Phoneme greift die Sprachsynthes- 
seeinrichtung dabei ebenfalls auf einen Phonemkatalog zu. Die 
Kompressionsrate kann eventuell noch gesteigert werden, indem 
der Strom der Kodezeichen vor dessen Ubertragung durch Anwen- 

20 dung eines weiteren Komprimierungsverf ahrens komprimiert und 
am Obermittlungsziel vor dem Zuftihren zur Sprachsyntheseein- 
richtung wieder dekomprimiert wird. 

Die Verwehdung sprecher- bzw. sprachspezif ischer Phonemkata- 
25 loge erhoht die Zuveriassigkeit der Phonemanalyse und damit 
auch die Qualitat der Sprachsynthese insbesondere bei Uber- 
tragung von Sprachdaten, die von verschiedenen Sprechern 
stammen. Weiterhin kann durch die Wahl des der Sprachsynthese 
zugrunde liegenden Phonemkatalogs die Wiedergabe der Sprach- 
30 daten auch vorgebbaren Erfordernissen angepafit werden, z.B. 

urn bestimmte Sprecher oder Sprachbesonderheiten zu simulieren 
Oder urn durch ein Verandern der Stimme auf besondere Umstande 
aufmerksam zu machen. 

35 Nach einer vorteilhaf ten Weiterbindung des erf indugsgemaBen 
Verfahrens kann ein Phonemkatalog wahrend einer Ubermittlung 
von Sprachdaten durch Analyse dieser konkret zu Ubermitteln- 
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den Sprachdaten - gegebenenf alls mehrmals - aktualisiert wer- 
den und/oder das neuronale Netz mittels der zu ubermittelnden 
Sprachdaten weiter trainiert werden. Auf diese Weise kann die 
Phonemanalyse bzw. die Sprachsynthese auch kurzf ristigen An- 
5 derungen von Spracheigenhei ten angepaBt werden 

GemaB einer Wei terbi Idling der Erfindung konnen Infonnationen 
tlber einen bei der Phonemanalyse verwendeten Phonemkatalog 
der Sprachsyntheseeinrichtung tibennittelt werden. Auf diese 

10 Weise ist es beispielsweise moglich, der Sprachsynteseein- 
richtung einen Wechsel eines Phonemkataloges, z.B. aufgrund 
eines Sprecher- Oder Sprachwechsels, anzuzeigen oder, falls 
ein zu verwendender Phonemkatalog dort noch nicht vorliegt, 
diesen ganz oder teilweise zu tibermitteln. Auch Anderungen 

15 . oder Aktualisierungen von Phonemkatalogen kOnnen so der 

Sprachsyntheseeinrichtung tlbermittelt und damit verfiigbar ge- 
macht werden. 

Eine weitere vorteilhafte Weiterbildung der Erfindung sieht 

20 vor, daB bei der Sprachsyntheseeinrichtung verschiedene, ftir 
die Phonemerzeugung relevante Parameter f wie z.B. die Lange, 
Lautstarke, Betonung, Stimmlage/ Stimme etc. mit der Phoneme 
wiedergegeben bzw. ausgegeben werden, einstellbar sind; vor- 
zugsweise ftir jedes eirizelne Phonem. Die Wiedergabe der tiber- 

25 mittelten Sprachdaten kann so unterschiedlichen Erfordemis- 
sen angepaBt werden. Beispielsweise kann die Wiedergabequali- 
tat i.a. verbessert werden, indem Laut- und/oder Stimmbeson- 
derheiten, wie z.B. die Lautstarke und Tonh6he von Silben 
oder ahnlicher Sprachelemente, vor dem Komprimieren aus den 

30 zu Ubermittelnden Sprachdaten extrahiert und der Sprachsyn- 
theseeinrichtung zum Einstellen von Wiedergabeparametern 
tibermittelt werden. Die Wiedergabeparameter konnen auch ab- 
hangig von einer Kennung eines die Sprachdatenen sendenden 
Teilnehmers eingestellt werden, um in die Sprachwiedergabe 

35 teilnehmerspezif ische Elemente einflieBen zu lassen, die z.B. 
den Teilnehmer anhand der wiedergegebenen Stimme identif i- 
zierbar machen konnen. 
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Weiterhin besteht die Moglichkeit, die von der Sprachdaten- 
quelle zum Obermitt lungs zi el zu ttbermittelnden Sprachdaten 
als Kodezeichen in einem Speicher zwischenzuspeichern, urn sie 
5 spater ein oder roehrraals abzurufen. Durch die Reduzierung der 
Sprachdaten auf die Phoneme reprasentierenden Kodezeichen 
wird hierftir in der Regel wesentlich weniger Speichplatz be- 
notigt als ftir ein Zwischenspeichern der unyeranderten 
Sprachdaten. 

10 

Die Phoneme reprasentierenden Kodezeichen bilden daruber hin- 
aus einen moglichen Ausgangspunkt fur eine vielfaltige Wei- 
terverarbeitung der Sprachdaten. Beispielsweise konnen die 
Kodezeichen in den zugeordneten Phonemen entsprechende Buch- 
15 stabengruppeh umgesetzt werden und so die Sprachdaten als 
Text ausgegeben werden. Auch viele zeitgemafie Verfahren zur 
automatischen Spracherkennung beruhen auf einem Zerlegen der 
Sprache in Phoneme und kdnnen daher direkt mit dem erfin- 
dungsgemaBen Verfahren kombiniert werden: 

20 

Die Erf indung wird nachfolgend anhand eines bevorzugten Aus- 
ftthrungsbeispiels unter Bezugnahme auf die Figur nSher erlau- 
tert. 

25 Die Figur zeigt in schematischer Darstellung zwei uber 

eine Obertiragungsstrecke verbundene Kommunikationsanla- 
gen. 

In der Figur ist eine als Sender von Sprachdaten fungierende 
30 Kommunikationsanlage 1 und eine damit Uber eine Obertragungs- 
strecke US verbundene, als Empfanger der Sprachdaten fungie- 
rende Kommunikationsanlage 2 schematisch dargestellt. Die 
Kommunikationsanlage 1 enthalt als Funktionskomponenten eine 
Sprachdatenquelle SD1 und ein daran angeschlossenes neurona- 
35 les Netz NN mit Zugriff auf sprecherspezif ische Phonemkatalo- 
ge PN1 und PN2. In der Kommunikationsanlage 2 sind eine an 
sprecherspezifische Phonemkataloge PS1 und PS 2 gekoppelte 



BNSDOCID. <WO_9940568A1J_> 



WO 99/40568. 



PCT/DE98/03812 



8 

Sprachsytheseeinrichtung SS und eine daran angeschlossene 
Sprachdatensenke SD2 dargestellt. 

Die Beschr^nkung auf zwei sprecherspezif ische Phonemkataloge 
5 je Kommunikationsanlage ist hier lediglich als beispielhaft 
anzusehen und dient der Vereinf achung der nachf olgenden Er- 
lauterung. 

In den sprecherspezif ischen Phonemkatalogen PN1 und PN2 sind 
10 jeweils Phoneme hinterlegt, die durch Analyse reprasentativer 
Sprachdaten als charakterist ische akustische Sprachelemente 
erkannt wurden. Die zur Erstellung der Phonemkataloge PN1, 
PN2 verwendeten reprasentativen Sprachdaten stammen dabei fUr 
jeden Phonemkatalog von einem spezif ischen Sprecher. Den hin- 
15 terlegten Phonemen ist jeweils ein fttr den betreffenden Pho- 
nemkatalog eindeutiges, abrufbares Kodezeichen zugeordnet. 

Das neuronal e Netz NN ist auf ein Erkennen der in den Phonem- 
katalogen PN1, PN2 hinterlegten Phoneme innerhalb eines 

20 Sprachdatenstroms trainiert, wobei einstellbar ist, welcher 
der Phonemkataloge PN1, PN2 bei dieser Phonemanalyse zugrun- 
dezulegen ist. Diese Einstellung kann beispielsweise dadurch 
erfolgen, daB dem neuronalen Netz eine dem jeweiligen Phonem- 
katalog PN1 bzw. PN2 entsprechende, sogenannte Gewichtsmatrix 

25 aufgepragt wird. 

Im Ausftihrungsbei spiel ist ein von der Sprachdatenquelle SD1 
ausgehender Sprachdatenstrom von der Kommunikationsanlage 1 
zur Sprachdatensenke SD2 in der Kommunikationsanlage 2 zu 

30 tlbermitteln, wobei die Sprachdaten vor der eigentlichen Ober- 
tragung zu komprimieren sind. Dazu wird von der Sprachdaten- 
quelle SD1 zunSchst eine Kennung eines die Sprachdaten sen- 
denden Teilnehmers dem neuronalen Netz NN zugeftihrt, das ab- 
hangig von der tibermittelten Kennung, einen diesem Teilnehmer 

35 zugeordneten sprecherspezif ischen Phonemkatalog - hier PN1 - 
ftir die nachf olgende Phonemanalyse auswShlt. Die Kennung wird 
daraufhin an die Kommunikationsanlage 2 weitertlbermittelt . 
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AnschlieBend wircl der zu tibermittelnde Sprachdatenstrom dem 
neuronalen Netz NN zugeftlhrt, das im Sprachdatenstrom auftre- 
tende Sprachdatenmuster nach den im ausgewahlten Phonemkata- 
log PN1 hinterlegten Phonemen klassif iziert . Fttr jedes 
5 Sprachdatenmuster, das erfolgreich einem hinterlegten Phonem 
zugeordnet werden kann f wird anstelle des Sprachdatenmusters 
das dem hinterlegten Phonem im Phonemkatalog zugeordnete Ko- 
dezeichen tiber die Ubertragungsstrecke US zur Kommunikations- 
anlage 2 tibertragen. Sprachdatenmuster, die nicht erfolgreich 
10 einem hinterlegten Phonem zugeordnet werden konnen, werden - 
durch ein mit den Phonemen zugeordneten Kodezeichen nicht 
Ubereinstimmendes, spezielies Kodezeichen gekennzeichnet - 
unverShdert libertragen. 

15 In der Kommunikationsanlage 2 wird zunachst, abhangig von der 
tibermittelten Kennung, ein der nachf olgenden Sprachsynthese 
zugrundezulegender Phomenkatalog hier PS1 - ausgewahlt. Der 
nachfolgend empf angene Strom von Kodezeichen wird sodann der 
Sprachsyntheseeinrichtung SS zugeftihrt, die ftir jedes Kode- 

20 zeichen das diesem im ausgewahlten Phonemkatalog PS1 zugeord- 
nete Phonem erzeugt und der Sprachdatensenke SD2 zuleitet. 
Die durch das spezielle Kodezeichen gekennzeichneten, unver- 
andert ubertragenen Sprachdatenmuster werden direkt zur 
Sprachdatensenke SD2 weitergeleitet • Auf diese Weise wird der 

25 Sprachdatenstrom wieder annShernd rekonstruiert bzw. dekom- 
primiert.. 

Die Phonemkataloge PS1 und PS2 sind im Ausftihrungsbeispiel 
als konventionelle Speicher realisiert, in denen jedem ent- 
30 haltenen Kodezeichen, eine zum Erzeugen des zugeordneten Pho- 
nems in der Sprachsyntheseeinrichtung SS erforderliche Infor- 
mation zugeordnet ist. Die Phonemkataloge PSl und PS2 konnen 
durch Abrufen bzw. Auslesen der Phonemkataloge PN1 bzw. PN2 
erstellt werden. 
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Patentansprtlche 

1 . Verf ahren zum Obermitteln von Sprachdaten von einer 
Sprachdatenquelle (SD1) zu einem Obermittlungsziel (SD2) 
5 unter Verwendung sprach- und/oder sprecherspezif ischer Pho- 
nemkataloge (PN1, PN2, PS1, PS2), in welchen Phonemen ent- 
sprechende Sprachdatenmuster hinterlegt sind, und jedem 
Phonem jeweils ein eindeutiges Kodezeichen zugeordnet ist, 
mit folgenden Schritten: 
10 a) abhangig von einer Kennung eines die Sprachdaten senden- 
den Teilhehmers wird ein diesem Teilnehmer zugeordneter 
sprecher- und/oder sprachspezif ischer Phonemkatalog (PN1) 
ausgewShlt, 

b) die zu iibermittelnden Sprachdaten werden einem auf das 
15 Erkennen der im ausgewahlten Phonemkatalog (PN1) hinterleg- 

ten Phoneme trainierten neuronalen Netz (NN) zugefiihrt, das 
die Sprachdaten hinsichtlich der in diesen enthaltenen Pho- 
neme analysiert/ 

c) fUr die in den Sprachdaten erkannten Phoneme wird das 

20 diesen im ausgewahlten Phonemkatalog (PN1) jeweils zugeord- 
nete Kodezeichen bestimmt, 

d) die Kodezeichen werden zu einer Sprachsyntheseeinrich- 
tung (SS) am Obermittlungsziel (SD2) Ubertragen, 

e) der Strom empfangener Kodezeichen wird durch die Sprach- 
25 syntheseeinrichtung (SS) in eine Abfolge von den Kodezei- 
chen in einem Phonemkatalog (PS1) jeweils zugebrdneten Pho- 
nemen umgesetzt/ und 

f ) diese Abfolge wird ausgegeben, 

30 2. Verf ahren zum Obermitteln von Sprachdaten von einer 

Sprachdatenquelle (SD1) zu einem Obermittlungsziel (SD2) 
unter Verwendung sprach- und/oder sprecherspezif ischer Pho- 
nemkataloge (PN1, PN2, PS1, PS2) , in welchen Phonemen ent- 
sprechende Sprachdatenmuster hinterlegt sind und jedem Pho- 

35 nem jeweils ein eindeutiges Kodezeichen zugeordnet ist, mit 
folgenden Schritten: 

a) die zu iibermittelnden Sprachdaten werden einem auf das 
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Erkennen verschiedener Sprachen und/oder Sprecher trainier- 
ten neuronalen Netz zugefUhrt, das eine Sprache, der die zu 
ubermittelnden Sprachdaten angehoren, und/oder einen Spre- 
cher/ von dem die zu Ubermittelnden Sprachdaten stamen, 
5 erkennt und ein Auswahlen eines dieser Sprache und/oder 

diesem Sprecher zugeordneten, sprach- und/oder sprecherspe- 
zifischen Phonemkatalogs (PN1) veranlaBt, 

b) die zu Ubermittelnden Sprachdaten werden einem auf das 
Erkennen der im ausgewahlten Phonemkatalog (PN1) hinterleg- 

10 ten Phoneme trainierten neuronalen Netz (NN) zugeftihrt, das 
die Sprachdaten hinsichtlich der in diesen enthaltenen Pho- 
neme analysiert, 

c) ftir die in den Sprachdaten erkannten Phoneme wird das 
diesen im ausgewahlten Phonemkatalog (PN1) jeweils zugeord- 

15 nete Kodezeichen bestimmt, 

d) die Kodezeichen werden zu einer Sprachsyntheseeinrich- 
tung (SS) am Ubermittlungsziel (SD2) Ubertragen, 

e) der Strom empfangener Kodezeichen wird durch die Sprach- 
syntheseeinrichtung (SS) in eine Abfolge von den Kodezei- 

20 chen in einem Phonemkatalog (PS1) jeweils zugeordneten Pho- 
nemen umgesetzt, und 

f) diese Abfolge wird ausgegeben. 

3. Verfahren nach Anspruch 1 oder 2, 
25 dadurch gekennzeichnet, 

daB die von der Sprachdatenquelle (SD1 ) zum Obermittlungs- 
ziel (SD2) zu Ubermittelnden Sprachdaten als Kodezeichen in 
einem Speicher zwischengespeichert werden. 

30 4. Verfahren nach einem der vorhergehenden Ansprtiche, 
dadurch gekennzeichnet, 

daB Informationen ttber einen bei der Phonemanalyse der zu 
Ubermittelnden Sprachdaten benutzten Phonemkatalog (PN1) 
der Sprachsyntheseeinrichtung (SS) am tJbermittlungsziel 
35 (SD2) Ubermittelt werden, urn dort fUr eine Rekonstruktion 
der tibermittelten Sprachdaten verwendet zu werden. 
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5. Verfahren nach einem der vorhergehenden Ansprtiche, 
dadurch gekennzeichnet , 

dafi ein Phonemkatalog (PN1, PN2, PS1, PS2) wahrehd einer 
Sprachiibermittlung unter Verwendung der zu tibermittelnden 
5 Sprachdaten aktualisiert wird. 

6. Verfahren nach einem der vorhergehenden Ansprtlche, 
dadurch gekennzeichnet, 

dafi das neuronale Netz (NN) wahrend eiher Sprachtlbertragung 
10 auf das Erkennen der zu tibermittelnden Sprachdaten trai- 
niert wird. 

7. Verfahren nach einem der vorhergehenden Ansprtiche, 
dadurch gekennzeichnet, 

15 dafi der Strom der zu tlbertragenden Kodezeichen vor der 

Obertragung durch Anwendung eines weiteren Komprimierungs- 
verfahrens komprimiert und am Obermittlurigsziel (SD2) wie- 
der dekomprimiert wird. 

20 8. Verfahren nach einem der vorhergehenden Ansprtiche, 
dadurch gekennzeichnet, 

dafi die Sprachsyntheseeinrichtung (SS) die Phoneme mit ein- 
stellbarer Lange, Lautstarke, Betonung, Stimmlage und/oder 
Stimme ausgibt. 

25 

9. Verfahren nach Anspruch 8, 

dadurch gekennzeichnet, 

dafi Laut- und/oder Stimmbesonderheiten vor dem Komprimieren 
aus den zu tibermittelnden Sprachdaten extrahiert und der 
30 Sprachsyntheseeinrichtung (SS) tibermittelt werden, um dort 
zum Einstellen der Lange, Lautstarke, Betonung., Stimmlage 
und/oder Stimme mit der die Phoneme ausgegebert werden, ver- 
wendet zu werden. 

35 10. Verfahren nach Anspruch 8 oder 9, 
dadurch gekennzeichnet, 

dafi die Kennung des die Sprachdaten sendenden Teilnehmers 
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der Sprachsyntheseeinrichtung (SS) ttbermittelt wird, und 
dort die Lange, LautstSrke, Betonung, Stimmlage und/oder 
Stimme mit der die Phoneme ausgegeben werden, abhangig von 
der Kennung eingestellt wird. 
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